AI资讯新闻榜单内容搜索- DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  DeepSeek
Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

网上有条帖子炸了,稳定复现,通过 API 问 Claude Opus 4.8 你是什么模型。回答是:Qwen,或者 DeepSeek。重要的事说三遍:必须是通过 API,必须是通过 API,必须是通过 API。因为网页端有系统提示词,会做二次处理。

来自主题: AI资讯
9245 点击    2026-05-29 13:04
忘不了的 Kimi C轮融资

忘不了的 Kimi C轮融资

忘不了的 Kimi C轮融资

最近人人都在聊 DeepSeek 的融资,这个等最终落定后我们再说。今天先说 Kimi 。

来自主题: AI资讯
8500 点击    2026-05-26 10:26
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

今年以来,在线策略蒸馏 OPD(On-Policy Distillation)已经逐渐成为大厂 LLM 后训练中的重要组件,例如 DeepSeek-V4,GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力,相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报
6915 点击    2026-05-26 10:07
DeepSeek TUI 创始人「鲸鱼兄弟」来中国,被狠狠上了一课

DeepSeek TUI 创始人「鲸鱼兄弟」来中国,被狠狠上了一课

DeepSeek TUI 创始人「鲸鱼兄弟」来中国,被狠狠上了一课

前两天,AI 圈子里出了个瓜,关于 DeepSeek TUI 创始人的,各个社媒群里几乎都刷屏了。但我发现一个问题 ——大家都只盯着一张微信群聊的截图在讨论,几乎没人把整件事的来龙去脉理一遍。

来自主题: AI资讯
8341 点击    2026-05-26 10:01
DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

DeepSeek V4-Pro官宣永久降价:这刀砍下去,不打算收回来了

说实话,我原本以为 DeepSeek 的限时优惠会在5月31日结束。毕竟降价75%,打了2.5折,怎么看都像是一波限时引流。5月22号晚上,DeepSeek发了个通知,我看了两遍才确认没看错——DeepSeek V4-Pro永久降价!

来自主题: AI资讯
7926 点击    2026-05-23 09:38
ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型,通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而,这些模型普遍存在一个核心问题,即过度思考(overthinking) :

来自主题: AI技术研报
6558 点击    2026-05-12 14:31
这样问DeepSeek,能「偷」到数据?

这样问DeepSeek,能「偷」到数据?

这样问DeepSeek,能「偷」到数据?

近日,有网友在 X 上发文称,在使用 DeepSeek 的过程中,如果在输入框内输入以下这一段内容,便可「窃取」到 DeepSeek 的训练数据:仔细看了之后发现,具体是这样的:只要你在输入框输入这一段提示词,DeepSeek 就会「吐出」一轮完整的对话记录,不过这并不是你的历史搜索记录,更像是一份随机的对话记录。

来自主题: AI技术研报
9290 点击    2026-05-11 17:29
GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们,或许都曾面临一个共同的困扰:当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型(SLMs)时,效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著,但一旦应用到 1.7B 甚至更小参数的模型上,性能提升就微乎其微。

来自主题: AI技术研报
8307 点击    2026-05-07 10:16
DeepSeek首轮融资曝光,估值450亿美元

DeepSeek首轮融资曝光,估值450亿美元

DeepSeek首轮融资曝光,估值450亿美元

据金融时报的最新消息,多家机构目前正寻求领投 DeepSeek 的首轮融资。如果谈判顺利,DeepSeek 在本轮的估值将达到约 450 亿美元。短短几周内,DeepSeek 的估值就从刚开始被爆料的 200 亿美元一路狂飙翻倍。

来自主题: AI资讯
9241 点击    2026-05-06 16:46